#!/usr/bin/python3
# -*- coding: utf-8 -*-

# 1. 导入模块
from selenium import webdriver
import time


# 2. 创建浏览器对象
# 创建浏览器2种方案
# 2.1> 指定驱动路径 (更推荐使用)
# 2.2> 通过 PATH 环境变量寻找,可以拷贝 驱动到 环境变量指定路径中，那么驱动就可以找到
options = webdriver.ChromeOptions()
# options.add_argument('--headless')
browser = webdriver.Chrome('/Users/zhuwei/Desktop/chromedriver',options=options) #''
# browser = webdriver.PhantomJS('/Users/zhuwei/Desktop/phantomjs/bin/phantomjs')

# 需要延迟加载
browser.implicitly_wait(10)

# 3. 访问网站
browser.get("https://www.douyu.com/directory/all")

while True:
    # 如果正在加载中，但是直接取获取就会出现问题
    time.sleep(1)

    a_tag_list = browser.find_elements_by_xpath('//a[@class="play-list-link"]')
    for a_tag in a_tag_list:
        item = {}
        item["title"] = a_tag.find_element_by_css_selector('.ellipsis').text
        item["author"] = a_tag.find_element_by_css_selector('.dy-name.ellipsis.fl').text
        item["img"] = a_tag.find_element_by_class_name("JS_listthumb").get_attribute("data-original")
        print(item)

    try:
        print("下一页")
        browser.find_element_by_class_name("shark-pager-next").click()
    except:
        break

# 4. 退出浏览器
browser.quit()